Устранение неполадок | Clusters_Federation
Руководство администратора Устранение неполадок

Устранение неполадок

Остановка репликации на пассивный кластер

Репликация данных на пассивный кластер может остановиться по нескольким причинам, например:

  • на активном кластере были удалены .xlog файлы, записи из которых не успели реплицироваться на пассивный кластер;

  • один из кластеров был аварийно остановлен и запущен снова в пассивном режиме.

Чтобы восстановить репликацию, проделайте следующие шаги:

  1. Определите текущий активный кластер. Например, выполните HTTP GET-запрос на адрес /tcf/status любого экземпляра кластера.

  2. Определите HTTP-адрес Destination, который реплицирует данные на пассивный кластер. Например, если вы используете Ansible Tarantool Enterprise (ATE) для обслуживания TCF, список серверов можно найти в инвентаре tcf.yml.

  3. Выполните HTTP POST-запрос на данный адрес Destination: /api/v1/rebootstrap. Данный запрос перезапускает репликатор с повторной инициализацией (rebootstrap).

  4. Проверьте, что в логах Destination есть информация об успешной репликации данных. Также в логах не должно быть ошибки missing xlog.

Некорректная инициализация экземпляров кластера

Иногда при инициализации экземпляров кластера возникает ошибка:

some instances are bootstrapped and some are not, only rebootstrap is supported in this case

Такая ошибка возникает, если при запуске кластера некоторые экземпляры были инициализированы (bootstrapped), а другие нет. Обычно это происходит из-за прерванного запуска или ошибок в начальной настройке.

Чтобы восстановить инициализацию экземпляров кластера, проделайте следующие шаги:

  1. Выполните HTTP GET-запрос на адрес /tcf/status, чтобы увидеть состояние всех экземпляров.

  2. Для восстановления корректного состояния всех экземпляров выполните HTTP POST-запрос: /api/v1/rebootstrap.

  3. После повторной инициализации убедитесь в отсутствии ошибки и успешной синхронизации.

Attention

Использование перезапуска с повторной инициализацией (rebootstrap) приводит к удалению всей информации о состоянии работы TCF до выполнения команды, а также всех пользовательских данных. Перед выполнением рекомендуется создать резервную копию.

Found what you were looking for?
Feedback